A Humán genom térképezése

HGMP – Human Genome Mapping Program – 1989

 

U.S. Department of Energy

Office of Energy Research
Office of Biological and Environmental Research
Biological and Environmental Research Program

Office of Biological and Environmental Research

(OBER - formerly Office of Health and Environmental Research) of DOE

Atomic Energy Commission

Energy Research and Development Administration

régóta támogatott kutatások:

genetika (mikroba, emlős),

genom szerkezet,

DNS replikáció,

reapir,

sugárzás-indukált mutációk

 

HUGO – Human Genome Organisation

        populáris, a kutatói közösség tagjai (1989)

HUGO Americas (USA, Canada)

HUGO Europe (GB központ)

HUGO Pacific (… Japán…+Ausztália)

 

 

Humán genom:

mindazon információk összessége, amely

az "ember" felépítéséhez szükséges

 

sejtmagban található DNS tárolja (+mtDNS)

 

A DNS szerveződése

Kromoszómák

egy-egy DNS szál, mindegyiken rengeteg gén

  

Az információ szerveződése

bázisok, "tripletek", "genetikai kód"

nucleotides

a "genetikai kód" – RNS kodon - aminosav

 

U

C

A

G

U

UUU Phenylalanine
UUC Phenylalanine
UUA Leucine
UUG Leucine

UCU Serine
UCC Serine
UCA Serine
UCG Serine

UAU Tyrosine
UAC Tyrosine
UAA Stop
UAG Stop

UGU Cysteine
UGC Cysteine
UGA Stop
UGG Tryptophan

C

CUU Leucine
CUC Leucine
CUA Leucine
CUG Leucine

CCU Proline
CCC Proline
CCA Proline
CCG Proline

CAU Histidine
CAC Histidine
CAA Glutamine
CAG Glutamine

CGU Arginine
CGC Arginine
CGA Arginine
CGG Arginine

A

AUU Isoleucine
AUC Isoleucine
AUA Isoleucine
AUG Methionine Start

ACU Threonine
ACC Threonine
ACA Threonine
ACG Threonine

AAU Asparagine
AAC Asparagine
AAA Lysine
AAG Lysine

AGU Serineine
AGC Serineine
AGA Arginine
AGG Arginine

G

GUU Valine
GUC Valine
GUA Valine
GUG Valine

GCU Alanine
GCC Alanine
GCA Alanine
GCG Alanine

GAU Aspartate
GAC Aspartate
GAA Glutamate
GAG Glutamate

GGU Glycine
GGC Glycine
GGA Glycine
GGG Glycine

 

Virális kód: csak fontos információ, "szünetmentes"

              a teljes DNS-ben tárolt információ "hasznos", átfedéses (!)

 

Prokarióta kód: szünetmentes, átfedés mentes

 

Eukarióta kód: NEM szünetmentes  "átfedés mentes" - ??

(azonos kód használat promóter-használat függvényében, spliceing variabilitás…)

 

A genom kb 10%-a tartalmaz fehérje-kódot (gén)

              kb. 3% expresszálódik (exon)

 A géneken belül és a gének között (97%) át nem írt

              szekvencia: intronok, intergén-DNS

  

A humán genom

       kb. 100.000 "gént" tartalmaz

kb. 30.000 expresszálható, pszeudogének, gén-szerkezetű elemek

       ez 24-féle kromoszómán tárolódik

             (22 autoszóma, X és Y)

fizikai térképezési stratégiák

 

        citogenetikai szint

                   nagy felbontású mikroszkópia (laser, confocal)

                   sejthibridek, mikrosejt és "radiációs" hibridek

                   CGH (Comparative Genomic Hybridization)

                   FISH (Fluorescent in situ Hybridization)

 

 

A genom megismerésének lépései, szintjei

(citogenetika, molekuláris genetika, klónozás, szekvenálás)

 

citogenetikai térképek:      felbontás ~ 1 cM* (centiMorgan) ~= 1 Mbp

linkage térképek:                felbontás ~ 1 cM* (centiMorgan) ~= 1 Mbp

“klóntérképek”:                  felbontás ~1 – 1000 kbp

fizikai térképek:                   felbontás  1 bp

                                                                       *Thomas Hunt Morgan,  1% rekombinációs gyakoriság

 

         molekuláris szint

                   klónozási eljárások, gén és DNS "könyvtárak"

                   kromoszóma séta, jumping, linking

DNS szekvenálás, STS, EST

contigok felállítása

 

leíró „genomika” az 1980-as évektől

funkcionális „genomika” ~1995-től

„proteomika” („a jövő”) ~2000-től

 

 

 

DNS méret nagy,

          kromoszóma (HGMP), (~50 Mbp – ~130 Mbp)

   fragmentálás, klónozás szükséges:

mesterséges kromoszómák (BAC, YAC), (~500 kbp – ~2 Mbp)

cosmid (< ~100 kbp)

fág (< ~20 kbp)

plazmid (< ~10 […] kbp)

 

    DNS  -  szekvenálási módszerek fejlettek, olcsók

szekvenálható mérettartomány: 1 bp  -~  2 kbp

 

 

HGP Human Genome Program (1989 – 2002?)

   kromoszóma térképek

         a DNS-en egymást követő szekvenciadarabok sorozata

                   gén (EST „expressed sequence tags”)

intergénikus régiók, intronok: (STS „site-tagged sequences”)

 

Total number of genes stored in GDB

 

Genes

Pseudogenes

Putative Genes

Mapped

11506

899

37

Unassigned

851

147

38588

Total

12357

1046

38625

2002.04.14.

GDB: Genome DataBase (http://gdbwww.gdb.org/)

Last Updated: Sun Apr 14 22:45:16 EDT 2002

 

Cytogenetic Map

Chromosome

Genes

Pseudogenes

Putative Genes

1

1039

49

5

2

707

108

2

3

511

28

1

4

410

17

 

5

520

27

2

6

667

61

1

7

720

60

7

8

345

18

2

9

401

23

 

10

336

17

2

11

704

46

1

12

578

10

2

13

158

16

 

14

635

119

 

15

320

22

2

16

382

25

1

17

665

23

1

18

166

8

 

19

656

38

1

20

250

9

 

21

226

58

3

22

367

63

2

X

692

37

2

Y

51

17

 

 

polimorfizmusok, repetitív szekvenciák, módosított szakaszok

 

polimorfizmus

 

parentális allélek        

- nukleotid szintű eltérések  (SNP > 4.175.659* ismert! dbSNP)

*humán, „submitted”, 2002-04-22

  humán, „reference”: 2.676.751

         - repetitív szekvenciák eltérései

                   mikroszatellitek (1 -6nt)

                            di- trinukleotid repeats

VNTR

                            mobilis elemek (retrotranszpozonok)

                                      LINE - 6 kbp 5'-UTR, ORF1&2, RT, 3'pA

                            repetitív szekvenciacsaládok

                                      alu